SciArena: Quando Cientistas Avaliam LLMs (E a Realidade Bate na Porta)
Descubra como a SciArena está avaliando LLMs em tarefas científicas reais com feedback humano. Veja quais modelos lideram e entenda por que a avaliação automática ainda é um desafio. Um olhar prático sobre a IA na ciência.